Alteryxの時系列比較(TS Compare)使い方や活用例を紹介
Alteryxの「時系列比較(TS Compare)」について、主な使い方や活用例を紹介します。
「時系列比較」とは?
「時系列比較」はAlteryxの時系列カテゴリにあるツールになります。
「時系列比較」を使うと、Alteryxでの時系列分析モデルを比べて、どちらのモデルが精度が高いかなどの判断をすることができます。
Alteryxの時系列分析では「指数平滑法」と「ARIMA」があるので、分析の際は「時系列比較」でまず双方のモデルを比較をしてみるのもオススメです。
実際にAlteryxで「時系列比較」を使うと、どのような比較ができるのか、サンプルデータを元に使い方を説明します。
時系列比較の使い方
「時系列比較」の使い方について解説します。
今回は以下ワークフローで時系列比較を使ってる部分にフォーカスを当てて説明します。
分析モデルをユニオンでつなぐ
「時系列比較」で比較したい分析モデルがあった場合、それらの出力データをユニオンでつなぎます。
この時につなぐデータは全データである必要ではないので、全体の7割程度のデータを抜粋します。
一般的には最低5000行程度のデータがあれば予測モデルの精度の確認ができるそうです。
出力の際は分析モデルの名前で出力されるので、それぞれ判別がつきやすい名前にしておくと、この後の比較が判断しやすくなります。
時系列比較にデータをつなぐ
「ユニオンの出力データ」と「分析モデルにつなげなかったデータ」を「時系列比較」につなげます。
「時系列比較」につないだら以下の出力がされます。
「O」の出力
実測値とどのくらいの差があるかを複数の定義に基づいて数値化します。
見方としては各項目の数字が小さい指標が多いモデルが誤差が少ないと判断できるので、各列毎の数字を見比べます。
今回の場合だと「ARIMA」を使った時系列分析の【arima_price】が精度の高い分析モデルだと判断できます。
「R」の出力
実測値と予想値の数字を見比べることができます。
実際及び予測の値
Actualが実データ、他2つが各分析モデルのデータになります。
正解率測定
実測値及び予測値
「I」の出力
時系列比較の活用例
分析したいデータを「時系列比較」して精度の高い分析モデルを確定させたら、その分析モデルで改めてワークフローを組んで予測分析します。
今回は「ARIMA」が精度が高い判定だったので、以下のようにARIMAをつないだワークフローをつくり、時系列予測を出力します。
まとめ
以上Alteryxの「時系列比較(TS Compare)」について主な使い方や活用例の紹介でした。
「指数平滑法」と「ARIMA」の見極めが明確にできるツールなので、時系列予測をする際は活用したがいいツールだと思います。
以下記事では時系列比較から精度の高いモデルを自動判定するワークフローを紹介してますので、気になる方はぜひ見てちょ。